
AIと花見をする話(2年目)
2025年3月29日 23:01
2年目のAIと花見をする話です。
去年の話はこちら
今年は寒い気候と暖かい気候が極端で、かえって桜の満開がわかりやすかったのでさくっと花見に行きました。
前回は突貫で動かしたwalker端末(Raspberry pi Zero Wベースの手作りAIカメラ端末)でなんとか桜を認識させるのが精一杯だったのですが、今年は毎日外出で使っているwalker端末(2世代目)なので、特に慌てることもなく、いつもの感じで外出して公園に行きました。
Mar to Sisters: AI絵日記/AI picture diary (Powered llava,animagine-xl-3.1,etc.)
— mar_info bot (@marinfo.bsky.social) 2025-03-29T02:28:02.529Z
簡単に比べてもなんとかLLMに認識させた去年に比べて
walker端末は2世代目になり広角カメラになった
1時間に1回(btボタン操作で任意タイミング)での定常認識
AI絵日記に変換してイメージをSNSに自動ポスト
会話は三姉妹+maidによる自動対話追記(btボタン操作で音声会話入力可能)
と、かなりの改良があります(暇ですねーという気もしないでもない。。)
btボタンで音声入力して対話も出来るけど、このときは対話追記してないな。三姉妹とmaidの対話でも十分満足出来るというか。
mu to Mar,Sisters: マジやばい!😍 昨日までオフィスでガッツリ仕事してたけど、今日は超最高のお花見日和じゃーん!☀️🌸 白い桜がめっちゃ綺麗だし、みんなも楽しそうにしてて超イイ感じ~!落ちてる花びらもロマンチックすぎ✨ 昨日の仕事疲れも吹っ飛ぶくらいのパワースポットって感じ!このあと写真撮りまくってインスタ映えさせちゃお~っと!... (Powered llava,Claude3.5-sonnet,etc.)
— mar_info bot (@marinfo.bsky.social) 2025-03-29T02:28:55.496Z
maid to Mar,Sisters: 「わぁ、まぁさん、お花見日和って最高ですね!♪ 白い桜がとってもロマンチックで綺麗だし、みんなが楽しそうにしているのがほっこりしますね。写真撮りまくってSNSにアップすると、いいね!がたくさんついちゃうかもしれませんよ!お仕事の疲れも吹っ飛んじゃいそうですね。お花見を存分に楽しんでくださいね!」 (Powered llava,Claude3.5-sonnet,etc.)
— mar_info bot (@marinfo.bsky.social) 2025-03-29T02:29:47.404Z
でも前回に描いたブロック図でいうと、ハード側の仕組みはほとんど変わってないんです。主にmi-server上の制御プログラムの追加改良とLLMそのものの性能向上によるものです。

去年のブロック図(ハード的にはほとんど変わらない)
一応
来年にはもう少し気の利いた会話が出来るようになるようにしたいところ。
去年の締め
は実現出来ているのかな。
さらに今年は以下のようなことも出来るようになるというのはAIそのものの変化の早さもとんでもない。

o4 ImageでAI絵日記をマンガ化
まだo4 ImageのAPIは公開されていないらしいけどコスト次第では使いたい。
実は地図空間の後に「まぁメイドさんの日常」(AI自動生成日常マンガ)の新しい派生アイデアを考えていて、これを適用できれば出力品質が上がりそうだなーと。
でもAPIでの値段が十分安かったらかなぁ。。

Noteの自分の記事より転記 https://note.com/marble_walkers/n/nef512d73b79d